智能论文笔记

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

DeepGraphONet: A Deep Graph Operator Network to Learn and Zero-shot Transfer the Dynamic Response of Networked Systems

Yixuan Sun , Christian Moya , Guang Lin , Meng Yue

分类：机器学习

2022-09-21

本文开发了一个深图运算符网络（DeepGraphonet）框架，该框架学会了近似具有基础子图形结构的复杂系统（例如电网或流量）的动力学。我们通过融合（i）图形神经网络（GNN）来利用空间相关的图形信息和（ii）深操作符网络〜（deeponet）近似动态系统的解决方案操作员的能力来构建深图载体。然后，所得的深图载体可以通过观察图形状态信息的有限历史来预测给定的短/中期时间范围内的动力学。此外，我们将深图载体设计为独立于解决方案。也就是说，我们不需要以精确/相同的分辨率收集有限的历史记录。此外，为了传播训练有素的Deepgraphonet的结果，我们设计了一种零摄像的学习策略，可以在不同的子图上使用它。最后，对（i）瞬态稳定性预测电网和（ii）车辆系统的交通流量预测问题的经验结果说明了拟议的Deepgraphonet的有效性。

translated by 谷歌翻译

Open-world Contrastive Learning

Yiyou Sun , Yixuan Li

分类：机器学习 | 计算机视觉

2022-08-04

在对比学习中，最近的进步表现出了出色的表现。但是，绝大多数方法仅限于封闭世界的环境。在本文中，我们通过挖掘开放世界的环境来丰富表示学习的景观，其中新颖阶级的未标记样本自然可以在野外出现。为了弥合差距，我们引入了一个新的学习框架，开放世界的对比学习（Opencon）。Opencon应对已知和新颖阶级学习紧凑的表现的挑战，并促进了一路上的新颖性发现。我们证明了Opencon在挑战基准数据集中的有效性并建立竞争性能。在Imagenet数据集上，Opencon在新颖和总体分类精度上分别胜过当前最佳方法的最佳方法，分别胜过11.9％和7.4％。我们希望我们的工作能为未来的工作打开新的大门，以解决这一重要问题。

translated by 谷歌翻译

Scene-Aware Prompt for Multi-modal Dialogue Understanding and Generation

Bin Li , Yixuan Weng , Ziyu Ma , Bin Sun , Shutao Li

分类：自然语言处理 | 计算机视觉

2022-07-05

本文介绍了Lingjing团队在NLPCC-2022-Shared-Task-4多模式对话理解和发电（MDUG）中的实验方案。MDUG任务可以分为两个阶段：多模式上下文理解和响应生成。为了充分利用视觉信息以获得场景的理解和对话的生成，我们提出了MDUG任务的场景感知提示。具体而言，我们利用多任务策略共同建模场景和会话多模式的理解。采用视觉标题来了解场景信息，而基于场景和会话感知标签的固定类型的模板提示则用于进一步改善对话生成性能。广泛的实验结果表明，与其他竞争方法相比，所提出的方法已经达到了最先进的（SOTA）性能，在此MDUG竞争中，我们在所有三个子任务中排名1-ST。

translated by 谷歌翻译

E2Efold-3D: End-to-End Deep Learning Method for accurate de novo RNA 3D Structure Prediction

Tao Shen , Zhihang Hu , Zhangzhi Peng , Jiayang Chen , Peng Xiong , Liang Hong , Liangzhen Zheng , Yixuan Wang , Irwin King , Sheng Wang

分类：机器学习

2022-07-04

RNA结构的确定和预测可以促进靶向RNA的药物开发和可用的共性元素设计。但是，由于RNA的固有结构灵活性，所有三种主流结构测定方法（X射线晶体学，NMR和Cryo-EM）在解决RNA结构时会遇到挑战，这导致已解决的RNA结构的稀缺性。计算预测方法作为实验技术的补充。但是，\ textit {de从头}的方法都不基于深度学习，因为可用的结构太少。取而代之的是，他们中的大多数采用了耗时的采样策略，而且它们的性能似乎达到了高原。在这项工作中，我们开发了第一种端到端的深度学习方法E2FOLD-3D，以准确执行\ textit {de de novo} RNA结构预测。提出了几个新的组件来克服数据稀缺性，例如完全不同的端到端管道，二级结构辅助自我鉴定和参数有效的骨干配方。此类设计在独立的，非重叠的RNA拼图测试数据集上进行了验证，并达到平均sub-4 \ aa {}根平方偏差，与最先进的方法相比，它表现出了优越的性能。有趣的是，它在预测RNA复杂结构时也可以取得令人鼓舞的结果，这是先前系统无法完成的壮举。当E2FOLD-3D与实验技术耦合时，RNA结构预测场可以大大提高。

translated by 谷歌翻译

Out-of-Distribution Detection with Deep Nearest Neighbors

Yiyou Sun , Yifei Ming , Xiaojin Zhu , Yixuan Li

分类：机器学习 | 计算机视觉

2022-04-13

分布（OOD）检测是在开放世界中部署机器学习模型的关键任务。基于距离的方法已经证明了有望，如果测试样品离分布（ID）数据相对遥远，则将测试样品视为OOD。但是，先前的方法对基础特征空间施加了强有力的分布假设，这可能并不总是存在。在本文中，我们探讨了非参数最近邻居距离的疗效，以检测OOD，这在文献中很大程度上被忽略了。与先前的工作不同，我们的方法不会施加任何分布假设，因此提供了更强的灵活性和一般性。我们证明了在几个基准测试中基于邻元的OOD检测的有效性，并建立了卓越的性能。在对Imagenet-1K训练的同一模型下，我们的方法将假阳性率（FPR@tpr95）降低了24.77％，与强大的基线SSD+相比，使用参数方法Mahalanobis在检测中。可用代码：https：//github.com/deeplearning-wisc/knn-ood。

translated by 谷歌翻译

A data-centric weak supervised learning for highway traffic incident detection

Yixuan Sun , Tanwi Mallick , Prasanna Balaprakash , Jane Macfarlane

分类：机器学习

2021-12-17

使用来自环路检测器传感器的数据，用于高速公路中交通事故的近实时检测对避免主要交通拥堵至关重要。虽然最近的监督机器学习方法通过利用人类标记的入射数据提供事件检测的解决方案，但误报率通常太高而无法在实践中使用。具体而言，事故的人类标签的不一致显着影响了监督学习模型的表现。为此，我们专注于一种以数据为中心的方法来提高准确性，降低高速公路上交通事故检测的误报率。我们开发了一个弱监管学习工作流程，为没有地面真理标签的入射数据生成高质量的训练标签，我们在监督学习设置中使用这些生成的标签进行最终检测。这种方法包括三个阶段。首先，我们介绍一个数据预处理和策策流水线，用于处理流量传感器数据，通过利用标签函数来生成高质量的培训数据，这可以是域知识相关或简单的启发式规则。其次，我们使用三个监督学习模型 - 随机森林，k最近邻居和支持向量机集合和长短期内存分类器来评估由弱监管生成的培训数据。结果表明，在使用受弱监管生成的培训数据后，所有模型的准确性都会显着提高。第三，我们开发了一种在线实时事件检测方法，在检测事件时利用模型集合和不确定性量化。总体而言，我们表明，我们提出的弱监管学习工作流程实现了高事件检测率（0.90）和低误报率（0.08）。

translated by 谷歌翻译

SimCLAD: A Simple Framework for Contrastive Learning of Acronym Disambiguation

Bin Li , Fei Xia , Yixuan Weng , Xiusheng Huang , Bin Sun , Shutao Li

分类：自然语言处理 | 人工智能

2021-11-29

首字母缩略词歧义意味着从字典中找到一个暧昧的缩写的正确含义，该词典是科学文档理解的关键点之一（SDU @ Aaai-22）。最近，许多尝试通过微调预先训练的屏蔽语言模型（MLMS）来试图解决这个问题，以获得更好的缩写表示。然而，首字母缩写含义在不同的上下文中变化，其对应的句子表示是用整个表示空间的窄子集占据的各向异性分布。来自预先训练的MLM的这种表示不适合来自给定字典的缩写歧义。在本文中，我们提出了一个简单的框架，用于比较歧义（SIMCLAD）方法的对比学习，以更好地了解缩略语意义。具体而言，我们设计了一种新的持续对比预训练方法，通过学习首字母句话表现的各向同性和歧视性分布来增强预先训练的模型的泛化能力。结果对英语科学领域的缩写歧义表明，该方法优于所有其他竞争最先进的（SOTA）方法。

translated by 谷歌翻译

PSG: Prompt-based Sequence Generation for Acronym Extraction

Bin Li , Fei Xia , Yixuan Weng , Xiusheng Huang , Bin Sun , Shutao Li

分类：自然语言处理 | 人工智能

2021-11-29

首字母缩略词提取旨在从文件中找到首字母缩略词（即，短文）及其含义（即，长形式），这对于科学文件理解（SDU @ Aaai-22）任务很重要。以前的作品致力于将此任务建模为段落级序列标记问题。但是，它缺乏有效利用外部知识，尤其是当数据集处于低资源设置时。最近，具有庞大培训的语言模型的基于及时的方法可以显着提高低资源下游任务的性能。在本文中，我们提出了一种用于缩写式提取任务的基于行的序列生成（PSG）方法。具体来说，我们设计一个模板，用于提示带有自动回归的提取的缩写文本。位置提取算法旨在提取所生成答案的位置。在低资源设置中越南语和波斯语的缩写提取的结果表明，所提出的方法优于所有其他竞争全能（SOTA）方法。

translated by 谷歌翻译

ReAct: Out-of-distribution Detection With Rectified Activations

Yiyou Sun , Chuan Guo , Yixuan Li

分类：机器学习

2021-11-24

由于其实际重要性，在提高神经网络安全部署方面的实际重要性，最近经济分配（OOD）检测最近受到了很大的关注。其中一个主要挑战是模型往往会对OOD数据产生高度自信的预测，这在ood检测中破坏了驾驶原理，即该模型应该仅对分布式样品充满信心。在这项工作中，我们提出了反应 - 一种简单有效的技术，用于减少对数据数据的模型过度限制。我们的方法是通过关于神经网络内部激活的新型分析，其为OOD分布显示出高度独特的签名模式。我们的方法可以有效地拓展到不同的网络架构和不同的OOD检测分数。我们经验证明，反应在全面的基准数据集套件上实现了竞争检测性能，并为我们的方法进行了理论解释。与以前的最佳方法相比，在ImageNet基准测试中，反应将假阳性率（FPR95）降低25.05％。

translated by 谷歌翻译